单细胞转录组逐渐沦为科研标配技术
前面我们在单细胞天地系统性的总结了如果你的课题设计是一个或者两个,三个甚至多个单细胞转录组样本,该如何分析辅助你的课题的生物学故事,实际上单细胞并不一定要是故事的主角,在单细胞数据该怎么利用?我们也提到了更深层次的数据分析展现技巧!
最近安排团队学习者帮忙系统性整理单细胞肿瘤研究的3大应用方向的文献,发现里面包含一个数据集,从另外一个维度给我们展现了它的价值!
单细胞数据在GSE108679,大家可以下载去玩一玩,其数据分析的全部描述如下:
其实数据分析就是我们单细胞天地发布的全网第一个单细胞转录组课程所精炼了常规单细胞转录组数据分析主线,就是5大R包, scater,monocle,Seurat,scran,M3Drop,然后10个步骤:
step1: 创建对象
step2: 质量控制
step3: 表达量的标准化和归一化
step4: 去除干扰因素(多个样本整合)
step5: 判断重要的基因
step6: 多种降维算法
step7: 可视化降维结果
step8: 多种聚类算法
step9: 聚类后找每个细胞亚群的标志基因进行亚群命名
step10: 继续分类
现在让我们来一一查看其中的主线图表:
降维聚类分群可视化
因为是CELL文章,所以图表会比较精炼,如下:
展示感兴趣基因的表达量
前面步骤分群后,很容易找到各个细胞亚群的标记基因,然后可视化如下:
细胞亚群功能注释
通常这一步,就是对每个细胞亚群的重要的基因进行GO/KEGG数据库注释,跟bulk转录组分析方法类似。
细胞亚群的稳定性
这个通常是诊断性图表,放在文章附件即可
不同细胞亚群有各自的标记基因
差异分析
这里作者感兴趣的是tSCs这一群细胞,跟所有其它细胞进行比较,差异分析进行热图展示:
作者的表达矩阵都公布了
在 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE108679 可以公开免费下载,然后走我们教给大家的10个步骤就可以完成文章大部分图表啦》
GSE108679_Phoenix_CSC_TPM.txt.gz 6.2 Mb (ftp)(http) TXT
GSE108679_Phoenix_OT1_TPM.txt.gz 9.7 Mb (ftp)(http) TXT
往期精彩
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
单细胞天地欢迎你